English / ქართული /








Journal number 4 ∘ Simon Gelashvili
New rules of Statistical Imputation for Interdependent Economic Time Series

The article describes the technological scheme of the production of „statistical finished products” and the prerequisites for implementation of imputation, as well as the imputation methods known to date and new ones. According to the official statistical information, correlation coefficient between households’ income and expenses is calculated (in the case of Georgia’s). On the basis of time series, the practical application of the new „triangle method” of the imputation is analyzed; its results are compared with the calculations made by various methods, which clearly revealed the high level of reliability of the new method developed by us.

Keywords: Imputation; Time Series; Correlation; Arithmetic Average; Forecasting.

ურთიერთდამოკიდებული ეკონომიკური დროითი მწკრივების სტატისტიკური იმპუტაციის ახალი წესები

სტატისტიკური ანალიზისა და პროგნოზირების აუცილებელი პირობაა სრული და საიმედო რაოდენობრივი მონაცემების არსებობა, რაც, პირველ რიგში, გულისხმობს დროში თანმიმდევრობას და პერიოდიზაციას, ასევე ფორმალიზებული ასახვის შესაძლებლობას [5, გვ. 9]. მაგრამ ეს პირობები ყოველთვის არ სრულდება, რისთვისაც საჭირო ხდება მკვლევარის მიერ დამატებითი სამუშაოს ჩატარება, რაც მოიცავს ინფორმაციის სისრულისა და საიმედოობის დონის ამაღლებას სხვადასხვა მეთოდის გამოყენებით. თანამედროვე ეტაპზე ერთ-ერთ ასეთ მეთოდს მიეკუთვნება იმპუტაცია. წინამდებარე სტატიის მიზანს წარმოადგენს სწორედ ურთიერთდამოკიდებული ეკონომიკური დროითი მწკრივების სტატისტიკური იმპუტაცია ახალი წესების გამოყენებით.

ეკონომიკაში ყველა მოვლენა და პროცესი ერთმანეთთან დაკავშირებულია, მაგრამ მათი ურთიერთკავშირის სიმჭიდროვე სხვადასხვა ხარისხისაა. მოცემულ სტატიაში ჩვენი კვლევის ინტერპრეტირებას მოვახდენთ ორი ურთიერთდამოკიდებული მაჩვენებლის - შინამეურნეობების შემოსავლებისა და დანახარჯების მიხედვით. აქვე უნდა აღვნიშნოთ, რომ მოვლენათა ურთიერთკავშირი და ურთიერთდამოკიდებულება არ არის იდენტური ცნებები: ეკონომიკაში ყველა მოვლენა და პროცესი ურთიერთკავშირშია, მაგრამ ბევრი მათგანი მნიშვნელოვნად არ არის ერთმანეთზე დამოკიდებული. მაშასადამე, ყველა ურთიერთდამოკიდებული მოვლენა ერთმანეთთან კავშირშია, მაგრამ ურთიერთკავშირში მყოფი ყველა მოვლენა არ არის ერთმანეთზე ძლიერ დამოკიდებული. ამ შემთხვევაში ჩვენ განვიხილავთ მხოლოდ ურთიერთდამოკიდებული მაჩვენებლების ამსახველი დროითი მწკრივების იმპუტაციის წესებს, რასაც როგორც თეორიული, ასევე დიდი პრაქტიკული მნიშვნელობა აქვს.

საკვანძო სიტყვები: იმპუტაცია; დროითი მწკრივი; არითმეტიკული საშუალო; კორელაცია; პროგნოზირება.

სტატისტიკური ინფორმაციის წარმოების სქემა

ნებისმიერი მოვლენისა და პროცესის (მათ შორის ეკონომიკური, სოციალური, ეკოლოგიური და სხვა) სტატისტიკური ანალიზი და პროგნოზირება შეუძლებელია სათანადო რაოდენობრივი მონაცემების არსებობის გარეშე, რომელსაც საკმარისად მაღალი სისრულე და ხარისხი უნდა ჰქონდეს. ასეთი მონაცემები უნდა აკმაყოფილებდეს შემდეგ ძირითად მოთხოვნებს [4, გვ. 64]:

1. სანდოობის მაღალი დონე;

2. სისრულის მაღალი ხარისხი;

3. მრავალფეროვნება და კომპლექსურობა.

ასეთი მოთხოვნებით უზრუნველყოფილი სტატისტიკური ინფორმაციის მიღებამდე მრავალი მარტივი და რთული, ტექნიკური და მეცნიერული ოპერაცია უნდა განხორციელდეს. ანალიზისა და პროგნოზირებისათვის ვარგისი სტატისტიკური მონაცემებისათვის „მზა პროდუქციის“ სახის მიცემა ძლიერ რთული და შრომატევადი პროცესია, რაც, თანამედროვე ეტაპზე, ძირითადად „საწარმოს შვიდ საამქროში“ ხორციელდება, რის შემდეგაც ის გადის ბაზარზე. ის მოიცავს მრავალ ტექნოლოგიურ ციკლს, რაც ზოგადი სქემით ასე შეიძლება წარმოვადგინოთ [1, გვ. 30]:

სტატისტიკის მზა პროდუქციის წარმოების ტექნოლოგიური ციკლი

 წარმოდგენილი სქემიდან ყოველი ტექნოლოგიური ციკლი, თავის მხრივ, მოიცავს მრავალ კონკრეტულ ეტაპს. ამ შემთხვევაში ჩვენ განვიხილავთ არა ყველა აქ მოცემულ ციკლს, არამედ მხოლოდ ერთს – იმპუტირებული მონაცემების გაანგარიშების ტექნიკას, ანუ იმპუტაციის პროცესს. იგი ერთ-ერთი ძირითადი ციკლია „სტატისტიკური მზა პროდუქციის“ წარმოების მთლიან პროცესში.

ნებისმიერი პროცესის ანალიზისა და პროგნოზირებისას მკვლევარის წინაშე ხშირად ჩნდება ისეთი პრობლემა, როგორიცაა საჭირო მოცულობისა და სტრუქტურის მონაცემთა უკმარისობა. იგი შეიძლება გამოწვეული იყოს სხვადასხვა ობიექტური მიზეზით. სწორედ ამ პრობლემის გადაჭრის ერთ-ერთი საშუალებაა სტატისტიკური იმპუტაცია, რაც პრაქტიკული შინაარსით წარმოადგენს რაიმე შესასწავლი პროცესის შესახებ არსებული მონაცემების შევსებას, მისი სისრულის დონის ამაღლებას. რეალურ სინამდვილეში ტექნიკურად ეს ხორციელდება პირობითი (გაანგარიშებითი) მონაცემების შეტანით მოცემული (არსებული) მონაცემების მთლიან მასაში. აქ იგულისხმება ის, რომ ანალიზისათვის საჭირო მონაცემთა ერთობლიობას (მასას) აკლია კონკრეტულ მონაცემთა რაღაც გარკვეული, მცირე ნაწილი. სწორედ ამ ნაწილის შევსების თეორიული და პრაქტიკული პროცესია იმპუტაცია. თანამედროვე პირობებში იგი უმეტესად ხორციელდება სპეციალური კომპიუტერული პროგრამების გამოყენებით, განსაკუთრებით კი მაშინ, როდესაც მოცემულია სტატისტიკური მონაცემების დიდი მასა, ანუ დაკვირვებათა დიდი რიცხვის შემცველი დროითი მწკრივები.

სტატისტიკური იმპუტაციის პროცესის განხორციელებამდე აუცილებელ ეტაპს წარმოადგენს არსებული ინფორმაციული მასივის შემოწმება, ანუ რედაქტირება მისი სისრულის დონის დასადგენად. ამ პროცესში, ჩვენი აზრით, შესაძლებელია სამი შემთხვევა [3, გვ. 59]:

  • არსებულ ინფორმაციულ მასივში კონკრეტულ მონაცემთა ნაკლებობა განპირობებულია შემთხვევითი ფაქტორებით;
  • ინფორმაციის მთლიან მასივში მონაცემთა ნაწილის არარსებობა განპირობებულია მისი კომპონენტური მონაცემების დაუზუსტებელი სიდიდეების არსებობით;
  • მონაცემთა ნაწილი შეიძლება არ არსებობდეს უკვე ჩატარებული შერჩევითი დაკვირვების არარეპრეზენტატულობის შედეგად.
  • აქ აღნიშნულ ყველა შემთხვევაში აუცილებელია განხორციელდეს სტატისტიკური იმპუტაცია, რათა საბოლოოდ მიღებული იქნეს ეკონომიკური თუ სოციალური ანალიზისათვის ვარგისი სათანადო მონაცემები.

 სტატისტიკური იმპუტაციის მეთოდების ზოგადი დახასიათება

საზღვარგარეთ დღემდე გამოცემულ სპეციალურ ლიტერატურაში ცნობილია სტატისტიკური იმპუტაციის როგორც მარტივი, ასევე რთული მეთოდები [6, გვ. 551], რომელთა გამოყენებაც შესაძლებელია არამხოლოდ ეკონომიკური, არამედ სოციალური, დემოგრაფიული და სხვა პროცესების რაოდენობრივი ანალიზის დროს. მაგრამ ამ ცნობილი მეთოდების გარდა, ჩვენ მიერ შემუშავებულია ზოგიერთი ახალი მეთოდიც, რაც ქვემოთ იქნება განხილული. ისინი მეტ-ნაკლები წარმატებით შეიძლება გამოყენებული იქნეს როგორც თეორიული, ასევე პრაქტიკული მიზნებით. იმპუტაციის როგორც უკვე ცნობილ, ასევე ჩვენ მიერ შემუშავებულ მეთოდებს მიეკუთვნება [2, გვ. 33]:

  • იმპუტაცია სტატისტიკური საშუალო სიდიდეების გამოყენებით;
  • სტრატიფიკაციული იმპუტაცია;
  • რეგრესიული იმპუტაცია;
  • იმპუტაცია „უახლოესი მეზობლის“ პრინციპით;
  • იმპუტაცია ისტორიული ანალოგიით;
  • მრავალჯერადი იმპუტაცია;
  • პროგნოზული იმპუტაცია;
  • იმპუტაცია სამკუთხედის მეთოდით;
  • იმპუტაცია ექსპერტული შეფასების მეთოდით.

აღნიშნული მეთოდების უმეტესობას, თავის მხრივ, გააჩნია კონკრეტული მოდიფიკაციები. ამჯერად ჩვენ ფართოდ და კონკრეტულად არ განვიხილავთ იმპუტაციის აქ ჩამოთვლილ მეთოდებს, არამედ შემოგთავაზებთ სტატისტიკური იმპუტაციის ახალ წესებს, რომლებიც ჩვენ მიერ იქნა შემუშავებული. მათი პრაქტიკული გამოყენების საილუსტრაციოდ და მიღებული შედეგების შედარებისათვის, მოვიყვანოთ ცხრილი 1 – „შინამეურნეობების შემოსავლებისა და დანახარჯების დინამიკა საქართველოში“, რომელშიც ასახულია ურთიერთდამოკიდებული მაჩვენებლების ორი დროითი მწკრივის დინამიკა 2003-2015 წლების პერიოდისათვის.

შინამეურნეობების შემოსავლებისა და დანახარჯების დინამიკა საქართველოში [8].

ცხრილი 1

 

ცხრილში მოცემული ორივე დროითი მწკრივის ვიზუალური შეფასებით ვლინდება ორი განსხვავებული ტენდენცია, კერძოდ: 2003-2008 წლების პერიოდში შინამეურნეობების შემოსავლების მოცულობა ყოველწლიურად ნაკლები იყო იმავე წლებში გაწეულ ხარჯებზე, ხოლო 2009-2015 წლებში კი ადგილი ჰქონდა საპირისპირო ტენდენციას, ანუ ყოველწლიურად შინამეურნეობების შემოსავლები უფრო მეტი იყო, ვიდრე ხარჯები, რაც ლოგიკური სიტუაციაა. როგორც სპეციალისტე-ბისთვის ცნობილია, შინამეურნეობების შემოსავლები და ხარჯები არამხოლოდ სხვა ფაქტორებთან, არამედ ერთმანეთთანაც მჭიდრო კორელაციაშია. აღნიშნულის დასადასტურებლად გავიანგარიშოთ კორელაციის წრფივი კოეფიციენტი, რისთვისაც გამოვიყენოთ სპეციალური ლიტერატურიდან კარგად ცნობილი შემდეგი ფორმულა:

 ცხრილი 2

როგორც ჩანს, განხილულ მაჩვენებლებს შორის წყვილადი კორელაციის წრფივი კოეფიციენტის კონკრეტული მნიშვნელობა ძალიან მაღალია, რაც მიუთითებს შინამეურნეობების შემოსავლებსა და ხარჯებს შორის მჭიდრო კორელაციურ ურთიერთკავშირზე. უფრო მეტიც, მათი ურთიერთდამოკიდებულება საქართველოს რეალობაში უახლოვდება ფუნქციონალურს, რაც ეკონომიკურად ნიშნავს იმას, რომ შინამეურნეობების შემოსავლების მოცულობა მცირეა და თითქმის მთლიანად მიდის აუცილებელი ხარჯების გაწევაზე. ამ შემთხვევაში კი დაგროვების სიდიდე მიზერული ან ნულია. ასეთი კანონზომიერებანი დამახასიათებელია მხოლოდ განვითარებადი ქვეყნებისათვის. ეკონომიკურად განვითარებულ ქვეყნებში კი განსხვავებული სიტუაციაა, კერძოდ: მოსახლეობის შემოსავლების მნიშვნელოვანი ნაწილი მიემართება დაგროვებაზე, რადგან შემოსავლების მოცულობა დიდად მეტია მოხმარების სიდიდეზე.

ახლა მივუბრუნდეთ მოცემულ დროით მწკრივებში იმპუტაციის განხორციელებას, რომლის დროსაც შესაძლებელია მრავალი ცნობილი თუ ჯერ კიდევ უცნობი, ანუ ახალი მეთოდის გამოყენება. ვთქვათ, მოყვანილ ცხრილში არ არის 2010 წლის საშუალო თვიური ხარჯები ერთ ადამიანზე გაანგარიშებით. მისი გამოთვლა მოვახდინოთ იმპუტაციის სხვადასხვა მეთოდით, რაც საშუალებას მოგვცემს ერთმანეთს შევუდაროთ მიღებული შედეგები და გამოვავლინოთ მათგან ყველაზე უფრო რეალური სიდიდე. იმპუტაციისთვის ჯერ გამოვიყენოთ სტატისტიკური საშუალოების მეთოდი. ამისათვის ავიღოთ ორი მოსაზღვრე წლის - 2009 და 2011 წლების მონაცემები და გავიანგარიშოთ მარტივი არითმეტიკული საშუალო სიდიდე:

 მიღებული შედეგების ურთიერთშედარებით ნათლად ჩანს, რომ სამივე  წესით [(4),(5)და(6)]გაანგარიშებული იმპუტირებული მონაცემი ერთი და იმავე სიდიდისაა,რაც   იმაზე მიუთითებს,  რომ          ჩვენ        მიერ      შემუშავებული     მარტივი        წესები       პრაქტიკულად რეალურ შედეგებს იძლევა, ანუ მათი გადახრა ფაქტობრივი სიდიდიდან უმნიშვნელოა და შეადგენს მხოლოდ0,5-ს(170,5−170), ანუ 0,3%-ს. მაშასადამე, იმპუტირებული მაჩვენებელი ემთხვევა ფაქტობრივს, რაც ჩვენი წესების მაღალ სანდოობაზე     მიუთითებს. აქვე ხაზგასმით უნდა აღინიშნოს ის, რომ იმპუტაციის „სამკუთხედის წესი“ შეიძლება გამოყენებული იქნეს როგორც მიკრო, ასევე მაკრომონაცემების არსებობისას. მაგრამ ეს მეთოდი გამოიყენება არა ნებისმიერ შემთხვევაში, არამედ მხოლოდ ურთიერთდამოკიდებული დროითი მწკრივების შემთხვევაში, ანუ იგი გულისხმობს მონაცემთა მინიმუმ 2მ წკრივის არსებობას.

იმისათვის, რომ დავრწმუნდეთ იმპუტაციის ჩვენი წესების სანდოობაში და გამოვრიცხოთ შემთხვევითობა, მათი გამოყენებით განვახორციელოთ არარსებული მაჩვენებლის იმპუტაცია სხვა წლის მიხედვითაც, მაგალითად, 2011 წლისათვის. ამ შემთხვევაში ვუშვებთ, რომ მოცემულ ცხრილში (1) არ არის 2011 წლის შინამეურნეობების ხარჯების მაჩვენებელი. ანალოგიურად გავიანგარიშოთ ის (4), (5) და (6) ფორმულების გამოყენებით. მივიღებთ:

მაშასადამე, იმპუტაცია სამივე წესის [(4), (5) და (6)] გამოყენებით მიიღება თითქმის ერთნაირი შედეგი (190,5 და 191 ლარი), რაც რეალურად ემთხვევა სიდიდეს, რომელიც შეადგენს 190 ლარს. ამიტომ ჩვენს მიერ შემოთავაზებული იმპუტაციის ახალი და ამასთან, მარტივი წესები (5) და (6) ხასიათდება სანდოობის მაღალი ხარისხით და ის წარმატებით შეიძლება გამოყენებული იქნეს ურთიერთდამოკიდებული ეკონომიკური (და არამხოლოდ ეკონომიკური) დროითი მწკრივების არსებობის შემთხვევაში. სხვადასხვა მოვლე- ნისა და პროცესის ანალიზისა და პროგნოზირების დროს სტატისტიკური იმპუტაციის რომელიმე მეთოდის გამოყენება დამოკიდებულია კვლევის ობიექტის თავისებურებებზე, მის შესახებ არსებულ მონაცემთა ერთობლიობაზე, ასევე კვლევის ძირითად მიზანსა და ამოცანებზე [7, გვ. 151]. ამასთან ერთად, ყველა შემთხვევაში გასათვალისწინებელია ის გარემოება, თუ როგორი მაჩვენებლები ესაჭიროება მკვლევარს: პირველადი, ემპირიული მონაცემები, თუ კრებსითი და საშუალო სიდიდეები. ამაზე ჩვენი პასუხი ასეთია: თუ მკვლევარის მიზანია უფრო მეტად პირველადი მაჩვენებლების განსაზღვრა, ვიდრე განზოგადებული და საშუალო სიდიდეების გაანგარიშება, მაშინ სტატისტიკური იმპუტაციის განხორციელება აუცილებელია და მას ალტერნატივა არა აქვს. აქ, რა თქმა უნდა, იგულისხმება ის შემთხვევა, როდესაც არსებული ინფორმაციული მასივი არასრულია და მას აკლია ერთი ან რამდენიმე მაჩვენებელი.

დასკვნები და რეკომენდაციები

ყოველივე ზემოაღნიშნულის საფუძველზე შეიძლება დავასკვნათ, რომ სტატისტიკური იმპუტაციის მეთოდების სრულყოფა და მისი პრაქტიკული გამოყენება ერთჯერადი აქტი კი არ არის, არამედ მუდმივად განვითარებადია. აქვე უნდა აღვნიშნოთ, რომ კვლევის პროცესში იმპუტაციის რომელიმე მეთოდის შერჩევა დამოკიდებულია საანალიზო მოვლენის თავისებურებებზე, მის შესახებ არსებულ სტატისტიკურ მონაცემებსა და მისი ცვლილების ტენდენციის მიმართულებაზე.

ჩვენ მიერ შემუშავებულმა იმპუტაციის ,,სამკუთხედის წესმა“ ანალიზის პროცესში სანდოობის მაღალი დონე აჩვენა, რაც იმის პირობაა, რომ საჭიროების შემთხვევაში ის წარმატებით შეიძლება იქნეს გამოყენებული ეკონომიკური თუ სხვა მოვლენების სტატისტიკურ ანალიზსა და პროგნოზირებაში.

ლიტერატურა:

1. გელაშვილი ს. ეკონომიკური პროცესების სტატისტიკური პროგნოზირება. გამომცემლობა „მერიდიანი“, თბილისი, 207 გვ., 2012.

2. გელაშვილი ს.  სტატისტიკური პროგნოზირება თანამედროვე ბიზნესში. მონოგრაფია. გამომცემლობა „მერიდიანი”, თბილისი, 200 გვ., 2012

3. გელაშვილი ს. (2007). სტატისტიკური იმპუტაცია – ეკონომიკური განვითარების ტენდენციების ანალიზის თანამედროვე მეთოდი. სამეცნიერო კონფერენცია თემაზე: „ეკონომიკური განვითარების თანამედროვე ტენდენციები პოსტკომუნისტურ ქვეყნებში“. პაატა გუგუშვილის სახელობის ეკონომიკის ინსტიტუტის შრომების კრებული, გამომცემლობა „მერიდიანი”, თბილისი, გვ. 58-61.

4. გელაშვილი ს. (2006). სტატისტიკური იმპუტაცია სოციალურ-ეკონომიკურ ანალიზში. ჟურნ. ,,ეკონომიკა”, №7-8, თბილისი, გვ. 45-51.

5. Gelaschwili, Simon (2007). Einführung in die Statistische Modellierung und Prognose. Universität Potsdam, Statistische Diskussionsbeiträge, Nr. 26: s. 25.

6. Schafer, Joseph L., and Maren K. Olsen (1998). „Multiple Imputation for Multivariate Missing-Data Problems: A Data Analyst’s Perspective.” Multivariate Behavioral Research 33(4): pp. 545–71.

7. Van Buuren, Stef, Jaap P.  L. Brand, Karin Groothuis-Oudshoorn, and  Donald  B. Rubin (2006). „Fully Conditional Specification in Multivariate Imputation.” Journal of Statistical Computation and Simulation 76(12): pp. 149–64.

8. საქართველოს სტატისტიკის ეროვნული სამსახურის ოფიციალური მონაცემები (www.geostat.ge)